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GenCore version 6.2.1 
Copyright (c) 1993 - 2008 Biocceleration Ltd. 



OM protein - protein search, using sw model 



September 18, 2008, 22:09:29 ; Search time 254 Seconds 
(without alignments) 
2487.264 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-09-961-086A-1 
3352 

1 MSSSNVEVFIPVSQGNTNGF MIVIFLTIAYLKLLFLKKYS 655 



Scoring table: BLOSUM6 2 

Gapop 10.0 , Gapext 0.5 

Searched: 4190237 seqs, 964526986 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : 



Published_Appl 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 
/ABSS/Data/< 



ications_AA_ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 
CRF/ptodata/ 



Main : 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 
2/pubpaa. 



./US 0 7_PUBCOMB . pep 
L/US08_PUBCOMB.pep 
./US09_PUBCOMB.pep. 
./US 1 0A_PUBCOMB . pep 
./US10B_PUBCOMB.pep 
7US 1 1 A_PUBCOMB . pep 
L/USllB_PUBCOMB.pep 
./US12_PUBCOMB.pep: 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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SUMMARIES 

Query 

Match Length DB ID Description 



1 


3352 


100 


0 


655 


3 


US- 


09 


-961 


-086-1 


Sequence 


1, Appli 


2 


3352 


100 


0 


655 


4 


US- 


10 


-405 


-806-13 


Sequence 


13, Appl 


3 


3352 


100 


0 


655 


6 


US- 


11 


-184 


-860-1 


Sequence 


1, Appli 


4 


3352 


100 


0 


655 


6 


US- 


11 


-674 


-429-13 


Sequence 


13, Appl 


5 


3346 


99 


8 


655 


3 


US- 


09 


-981 


-353-35 


Sequence 


35, Appl 


6 


3346 


99 


8 


655 


4 


us- 


10 


-120 


-687-61 


Sequence 


61, Appl 


7 


3346 


99 


8 


655 


4 


us- 


10 


-405 


-806-2 


Sequence 


2, Appli 


8 


3346 


99 


8 


655 


5 


us- 


10 


-874 


-706-24 


Sequence 


2 4, Appl 


9 


3346 


99 


8 


655 


5 


us- 


10 


-517 


-310-2 


Sequence 


2, Appli 


10 


3346 


99 


8 


655 


6 


us- 


11 


-124 


-368A-296 


Sequence 


2 96, App 


11 


3346 


99 


8 


655 


6 


us- 


11 


-124 


-368A-297 


Sequence 


2 97, App 


12 


3346 


99 


8 


655 


6 


us- 


11 


-333 


-542-6 


Sequence 


6, Appli 


13 


3346 


99 


8 


655 


6 


us- 


11 


-371 


-354-63697 


Sequence 


63697, A 


14 


3346 


99 


8 


655 


6 


us- 


11 


-443 


-428A-811925 


Sequence 


811925, 


15 


3346 


99 


8 


655 


6 


us- 


11 


-443 


-428A-811926 


Sequence 


811926, 


16 


3346 


99 


8 


655 


6 


us- 


11 


-443 


-428A-811927 


Sequence 


811927, 


17 


3346 


99 


8 


655 


6 


us- 


11 


-443 


-428A-811928 


Sequence 


811928, 


18 


3346 


99 


8 


655 


6 


us- 


11 


-438 


-790-61 


Sequence 


61, Appl 


19 


3346 


99 


8 


655 


6 


us- 


11 


-674 


-429-2 


Sequence 


2, Appli 


20 


3346 


99 


8 


655 


8 


us- 


12 


-055 


-089-2 


Sequence 


2, Appli 


21 


3346 


99 


8 


688 


6 


us- 


11 


-443 


-428A-811930 


Sequence 


811930, 


22 


3346 


99 


8 


775 


6 


us- 


11 


-443 


-428A-811929 


Sequence 


811929, 


23 


3342 


99 


7 


655 


6 


us- 


11 


-333 


-542-8 


Sequence 


8, Appli 


24 


3338 


99 


6 


655 


3 


us- 


09 


-866 


-866A-27 


Sequence 


2 7, Appl 


25 


3331 


99 


4 


655 


3 


us- 


09 


-866 


-866A-10 


Sequence 


10, Appl 


26 


3331 


99 


4 


655 


4 


us- 


10 


-090 


-455-5 


Sequence 


5, Appli 


27 


3331 


99 


4 


655 


6 


us- 


11 


-037 


-713-31 


Sequence 


31, Appl 


28 


3331 


99 


4 


655 


6 


us- 


11 


-333 


-542-7 


Sequence 


7, Appli 


29 


3331 


99 


4 


655 


6 


us- 


11 


-588 


-744-2 


Sequence 


2, Appli 


30 


3225 


96 


2 


655 


6 


us- 


11 


-333 


-542-2 


Sequence 


2, Appli 


31 


3223.5 


96 


2 


654 


6 


us- 


11 


-333 


-542-5 


Sequence 


5, Appli 


32 


3216 


95 


9 
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5 


us- 


10 


-692 


-382-3396 


Sequence 


3396, Ap 


33 


3216 


95 


9 


643 


5 


us- 


10 


-692 


-382-3398 


Sequence 


3398, Ap 


34 


3053.5 


91 


1 


604 


3 


us- 


09 


-745 


-763-197 


Sequence 


197, App 


35 


3045 


90 


8 


632 


6 


us- 


11 


-443 


-428A-811931 


Sequence 


811931, 


36 


2927 


87 


3 


623 


6 


us- 


11 


-443 


-428A-811932 


Sequence 


811932, 


37 


2862 


85 


4 


658 


6 


us- 


11 


-427 


-230-185 


Sequence 


185, App 


38 


2757 


82 


2 


657 


3 


us- 


09 


-866 


-866A-14 


Sequence 


14, Appl 


39 
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us- 


10 


-917 


-503-12962 


Sequence 


12962, A 


40 


1730.5 
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us- 


10 


-692 


-382-3393 


Sequence 


3393, Ap 


41 


835.5 
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1049 
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us- 


10 


-369 


-493-1520 


Sequence 


1520, Ap 


42 


833 


24 


9 


1095 


5 


us- 


10 


-449 


-902-41563 


Sequence 


41563, A 


43 


821.5 


24 


5 


1078 


6 


us- 


11 


-431 


-855-20717 


Sequence 


20717, A 


44 
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24 
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1038 


6 


us- 


11 


-431 


-855-26719 


Sequence 


26719, A 


45 
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24 
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us- 


10 
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-605-245 


Sequence 


2 45, App 



ALIGNMENTS 
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RESULT 1 
US-09-961-086-1 

; Sequence 1, Application US/09961086 

; Publication No. US20030036645A1 

; GENERAL INFORMATION: 

; APPLICANT: UNIVERSITY OF MARYLAND, BALTIMORE 
; APPLICANT: ROSS, Douglas D. 
; APPLICANT: DOYLE, L. Austin 
; APPLICANT: ABRUZZO, Lynne 

; TITLE OF INVENTION: BREAST CANCER RESISTANCE PROTEIN (BCRP) AND THE DNA 
; TITLE OF INVENTION: WHICH ENCODES IT 
; FILE REFERENCE: EP19376-019 

; CURRENT APPLICATION NUMBER: US/ 0 9/ 96 1 , 0 86 

; CURRENT FILING DATE: 2001-09-21 

; PRIOR APPLICATION NUMBER: US 60/073,763 

; PRIOR FILING DATE: 1998-02-05 

; PRIOR APPLICATION NUMBER: PCT/US99/02577 

; PRIOR FILING DATE: 1999-02-05 

; NUMBER OF SEQ ID NOS : 7 

; SOFTWARE: Patentln Ver . 2.1 

; SEQ ID NO 1 

; LENGTH: 655 

; TYPE: PRT 

; ORGANISM: Homo sapiens 
US-09-961-086-1 



Query Match 100.0%; Score 3352; DB 3; Length 655; 

Best Local Similarity 100.0%; Pred. No. 6.5e-288; 

Matches 655; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 



61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 



121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 



181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 



241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 



Qy 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 



Qy 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 
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Db 



361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 



Qy 



421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 




Db 



421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 



Qy 



481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 




Db 



481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 



Qy 



541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 




Db 



541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 



Qy 



601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 




Db 



601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 2 

US-10-405-806-13 

; Sequence 13, Application US/10405806 

; Publication No. US20030232362A1 

; GENERAL INFORMATION: 

; APPLICANT: KOMATANI, HIDEYA 

; APPLICANT: HARA, YOSHIKAZU 

; APPLICANT: KOTANI, HIDEHITO 

; APPLICANT: NAKAGAWA, RINAKO 

; TITLE OF INVENTION: DRUG RESISTANT GENE AND USE THEREOF 

; FILE REFERENCE: 234985US0CONT 

; CURRENT APPLICATION NUMBER: US/10/405,806 

; CURRENT FILING DATE: 2003-04-03 

; PRIOR APPLICATION NUMBER: PCT/ JP01/08112 

; PRIOR FILING DATE: 2001-09-18 

; PRIOR APPLICATION NUMBER: JP2000-303441 

; PRIOR FILING DATE: 2000-10-03 

; NUMBER OF SEQ ID NOS : 17 

; SOFTWARE: Patentln version 3.2 

; SEQ ID NO 13 

; LENGTH: 655 

; TYPE: PRT 

; ORGANISM: Artificial Sequence 
; FEATURE : 

; OTHER INFORMATION: ABCG2 482Tmutant sequence 
US-10-405-806-13 

Query Match 100.0%; Score 3352; DB 4; Length 655; 

Best Local Similarity 100.0%; Pred. No. 6.5e-288; 

Matches 655; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 
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61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 3 
US-11-184-860-1 

; Sequence 1, Application US/11184860 

; Publication No. US20050272684A1 

; GENERAL INFORMATION: 

; APPLICANT: UNIVERSITY OF MARYLAND, BALTIMORE 
; APPLICANT: ROSS, Douglas D. 
; APPLICANT: DOYLE, L. Austin 
; APPLICANT: ABRUZZO, Lynne 

; TITLE OF INVENTION: BREAST CANCER RESISTANCE PROTEIN (BCRP) AND THE DNA 
; TITLE OF INVENTION: WHICH ENCODES IT 
; FILE REFERENCE: EP19376-019 

; CURRENT APPLICATION NUMBER: US/11/184,860 
; CURRENT FILING DATE: 2005-07-20 
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PRIOR APPLICATION NUMBER: US / 09 / 96 1 , 0 86 
PRIOR FILING DATE: 2001-09-21 
PRIOR APPLICATION NUMBER: US 60/073,763 
PRIOR FILING DATE: 1998-02-05 
PRIOR APPLICATION NUMBER: PCT/US99/02577 
PRIOR FILING DATE: 1999-02-05 
NUMBER OF SEQ ID NOS : 7 
SOFTWARE: Patentln Ver . 2.1 
SEQ ID NO 1 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-184-860-1 

Query Match 100.0%; Score 3352; DB 6; Length 655; 

Best Local Similarity 100.0%; Pred. No. 6.5e-288; 

Matches 655; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

Qy 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

Qy 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

Qy 421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TGIQNRA GVLFFLTTNQCFSSVSAVELF WE KKLF I HEYI SGYYRVSSYFLGKLLSDLLP 480 

Qy 481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 540 

Qy 541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 600 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 4 

US-11-674-429-13 

Sequence 13, Application US/11674429 
Publication No. US20070141619A1 
GENERAL INFORMATION: 

APPLICANT: KOMATANI, HIDEYA 

APPLICANT: HARA, YOSHIKAZU 

APPLICANT: KOTANI, HIDEHITO 

APPLICANT: NAKAGAWA, RINAKO 

TITLE OF INVENTION: DRUG RESISTANT GENE AND USE THEREOF 
FILE REFERENCE: 234985US0CONT 
CURRENT APPLICATION NUMBER: US/ 1 1 / 6 74 , 42 9 
CURRENT FILING DATE: 2007-02-13 
PRIOR APPLICATION NUMBER: US/10/405,806 
PRIOR FILING DATE: 2003-04-03 
PRIOR APPLICATION NUMBER: PCT/ JP01/08112 
PRIOR FILING DATE: 2001-09-18 
PRIOR APPLICATION NUMBER: JP2000-303441 
PRIOR FILING DATE: 2000-10-03 
NUMBER OF SEQ ID NOS : 17 
SOFTWARE: Patentln version 3.2 
SEQ ID NO 13 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: ABCG2 482Tmutant sequence 
US-11-674-429-13 

Query Match 100.0%; Score 3352; DB 6; Length 655; 

Best Local Similarity 100.0%; Pred. No. 6.5e-288; 

Matches 655; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 



241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 I TVFKEISYTTSFCHQLRWVSKRSFKNLLGNPQAS I AQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 5 

US-09-981-353-35 

; Sequence 35, Application US/09981353 

; Patent No. US20020160382A1 

; GENERAL INFORMATION: 

; APPLICANT: Lasek, Amy W. 

; APPLICANT: Jones, David A. 

; TITLE OF INVENTION: GENES EXPRESSED IN COLON CANCER 
; FILE REFERENCE: PA-0038 US 

; CURRENT APPLICATION NUMBER: US/ 0 9/ 9 81 , 3 53 

; CURRENT FILING DATE: 2001-10-11 

; NUMBER OF SEQ ID NOS : 194 

; SOFTWARE: PERL Program 

; SEQ ID NO 35 

; LENGTH: 655 

; TYPE: PRT 

; ORGANISM: Homo sapiens 
; FEATURE : 

; NAME/KEY: misc_feature 

; OTHER INFORMATION: Incyte ID No. US20020160382A1 5517972CD1 
US-09-981-353-35 

Query Match 99.8%; Score 3346; DB 3; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 
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Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 I TVFKEISYTTSFCHQLRWVSKRSFKNLLGNPQAS I AQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 6 

US-10-120-687-61 

; Sequence 61, Application US/10120687 
; Publication No. US20030082155A1 
; GENERAL INFORMATION: 

; APPLICANT: Massachusetts General Hospital 

; TITLE OF INVENTION: Stem Cells of the Islets of Langerhans and Their Use in Treating 
Diabetes 
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TITLE OF INVENTION: Mellitus 
FILE REFERENCE: 3284/1235B 

CURRENT APPLICATION NUMBER: US/10/120,687 
CURRENT FILING DATE: 2002-04-11 
PRIOR APPLICATION NUMBER: US60/169082 
PRIOR FILING DATE: 1999-12-06 
PRIOR APPLICATION NUMBER: US 09/963,875 
PRIOR FILING DATE: 2001-09-25 
PRIOR APPLICATION NUMBER: US 60/215109 
PRIOR FILING DATE: 2000-06-28 
PRIOR APPLICATION NUMBER: US 60/238880 
PRIOR FILING DATE: 2000-10-06 
PRIOR APPLICATION NUMBER: US 09/731261 
PRIOR FILING DATE: 2000-12-06 
NUMBER OF SEQ ID NOS : 61 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 61 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-10-120-687-61 

Query Match 99.8%; Score 3346; DB 4; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

Qy 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

Qy 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

Qy 421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 480 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 7 
US-10-405-806-2 

Sequence 2, Application US/10405806 
Publication No. US20030232362A1 
GENERAL INFORMATION: 
APPLICANT: KOMATANI, HIDEYA 
APPLICANT: HARA, YOSHIKAZU 
APPLICANT: KOTANI, HIDEHITO 
APPLICANT: NAKAGAWA, RINAKO 

TITLE OF INVENTION: DRUG RESISTANT GENE AND USE THEREOF 
FILE REFERENCE: 234985US0CONT 
CURRENT APPLICATION NUMBER: US/10/405,806 
CURRENT FILING DATE: 2003-04-03 
PRIOR APPLICATION NUMBER: PCT/ JP01/08112 
PRIOR FILING DATE: 2001-09-18 
PRIOR APPLICATION NUMBER: JP2000-303441 
PRIOR FILING DATE: 2000-10-03 
NUMBER OF SEQ ID NOS : 17 
SOFTWARE: Patentln version 3.2 
SEQ ID NO 2 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-10-405-806-2 

Query Match 99.8%; Score 3346; DB 4; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 



181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 8 

US-10-874-706-24 

Sequence 24, Application US/10874706 
Publication No. US20050048610A1 
GENERAL INFORMATION: 

APPLICANT: INCYTE GENOMICS, INC. 

APPLICANT: LAL, Preeti 

APPLICANT: YANG, Junming 

APPLICANT: YUE, Henry 

APPLICANT: HILLMAN, Jennifer L. 

APPLICANT: TANG, Y. Tom 

APPLICANT: BANDMAN, Olga 

APPLICANT: BURFORD, Neil 

APPLICANT: BAUGHN, Mariah R. 

APPLICANT: AZIMZAI, Yalda 

APPLICANT: LU, Dyung Aina M. 

APPLICANT: AU- YOUNG, Janice 

APPLICANT: PATTERSON, Chandra 

TITLE OF INVENTION: HUMAN TRANSPORT PROTEINS 
FILE REFERENCE: PF-0709 PCT 
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CURRENT APPLICATION NUMBER: US/10/874,706 
CURRENT FILING DATE: 2004-06-24 
PRIOR APPLICATION NUMBER: US/10/009,328 
PRIOR FILING DATE: 2001-12-04 

PRIOR APPLICATION NUMBER: 60/139,923; 60/148,177; 60/149,357; 60/162,287 
PRIOR FILING DATE: 1999-06-17; 1999-08-10; 1999-08-18; 1999-10-28 
NUMBER OF SEQ ID NOS : 86 
SOFTWARE: PERL Program 
SEQ ID NO 24 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_feature 

OTHER INFORMATION: Incyte ID No: 5517972CD1 
S-10-874-706-24 

Query Match 99.8%; Score 3346; DB 5; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

y 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

y 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

y 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

y 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

y 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

y 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

y 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

y 421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 421 TGIQNRA GVLFFLTTNQCFSSVSAVELF WE KKLF I HEYI SGYYRVSSYFLGKLLSDLLP 480 

y 481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 9 
US-10-517-310-2 

; Sequence 2, Application US/10517310 

; Publication No. US20060057579A1 

; GENERAL INFORMATION: 

; APPLICANT: KOTANI, HIDEHITO 

; APPLICANT: MIZUARAI, SHINJI 

; TITLE OF INVENTION: METHOD FOR PREDICTING A DRUG TRANSPORT CAPABILITY BY ABCG2 

; TITLE OF INVENTION: POLYMORPHISMS 

; FILE REFERENCE: 262507US0PCT 

; CURRENT APPLICATION NUMBER: US/10/517,310 

; CURRENT FILING DATE: 2004-12-17 

; PRIOR APPLICATION NUMBER: PCT/ JP03/07534 

; PRIOR FILING DATE: 2003-06-13 

; PRIOR APPLICATION NUMBER: JP 2002-175806 

; PRIOR FILING DATE: 2002-06-17 

; NUMBER OF SEQ ID NOS : 68 

; SOFTWARE: Patentln version 3.3 

; SEQ ID NO 2 

; LENGTH: 655 

; TYPE: PRT 

; ORGANISM: Homo sapiens 
US-10-517-310-2 



Query Match 99.8%; Score 3346; DB 5; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 



Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 



121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 



181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 
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241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 10 

US-11-124-368A-296 

; Sequence 296, Application US/11124368A 

; Publication No. US20050287559A1 

; GENERAL INFORMATION: 

; APPLICANT: Michele Cargill 

; APPLICANT: James J. Devlin 

; APPLICANT: May Luke 

; TITLE OF INVENTION: Genetic Polymorphisms Associated with 

; TITLE OF INVENTION: Vascular Diseases, Methods of Detection and Uses Thereof 
; FILE REFERENCE: CL001524 

; CURRENT APPLICATION NUMBER: US/11/124, 368A 

; CURRENT FILING DATE: 2005-05-09 

; PRIOR APPLICATION NUMBER: US 60/568,845 

; PRIOR FILING DATE: 2004-05-07 

; PRIOR APPLICATION NUMBER: US 60/625,936 

; PRIOR FILING DATE: 2004-11-09 

; NUMBER OF SEQ ID NOS : 21112 

; SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 296 

; LENGTH: 655 

; TYPE: PRT 

; ORGANISM: Homo sapiens 
US-11-124-368A-296 

Query Match 99.8%; Score 3346; DB 6; Length 655; 
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Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

y 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

y 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

y 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

y 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

y 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 11 

US-11-124-368A-297 

; Sequence 297, Application US/11124368A 

; Publication No. US20050287559A1 

; GENERAL INFORMATION: 

; APPLICANT: Michele Cargill 

; APPLICANT: James J. Devlin 
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APPLICANT: May Luke 

TITLE OF INVENTION: Genetic Polymorphisms Associated with 

TITLE OF INVENTION: Vascular Diseases, Methods of Detection and Uses There 
FILE REFERENCE: CL001524 

CURRENT APPLICATION NUMBER: US/11/124, 368A 
CURRENT FILING DATE: 2005-05-09 
PRIOR APPLICATION NUMBER: US 60/568,845 
PRIOR FILING DATE: 2004-05-07 
PRIOR APPLICATION NUMBER: US 60/625,936 
PRIOR FILING DATE: 2004-11-09 
NUMBER OF SEQ ID NOS : 21112 
SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 297 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-124-368A-297 

Query Match 99.8%; Score 3346; DB 6; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

Qy 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

Qy 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 420 

Qy 421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TGIQNRA GVLFFLTTNQCFSSVSAVELF WE KKLF I HEYI SGYYRVSSYFLGKLLSDLLP 480 

Qy 481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 540 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 12 
US-11-333-542-6 

Sequence 6, Application US/11333542 

Publication No. US20060160139A1 

GENERAL INFORMATION: 
APPLICANT: TAKEBE, NAOKO 

TITLE OF INVENTION: RHESUS BCRP AND ANTIBODIES THERETO 
FILE REFERENCE: UNIMD-0016 

CURRENT APPLICATION NUMBER: US/ 1 1 / 3 33 , 5 42 
CURRENT FILING DATE: 2006-01-18 
PRIOR APPLICATION NUMBER: 60/644,706 
PRIOR FILING DATE: 2005-01-18 
NUMBER OF SEQ ID NOS : 13 
SOFTWARE: Patentln Ver . 3.3 
SEQ ID NO 6 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-333-542-6 

Query Match 99.8%; Score 3346; DB 6; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 
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301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 13 

US-11-371-354-63697 

; Sequence 63697, Application US/11371354 

; Publication No. US20060275794A1 

; GENERAL INFORMATION: 

; APPLICANT: CARRINO, JOHN 

; APPLICANT: LIANG, FENG 

; TITLE OF INVENTION: COLLECTIONS OF MATCHED BIOLOGICAL REAGENTS AND METHODS FOR 

; TITLE OF INVENTION: IDENTIFYING MATCHED REAGENTS 

; FILE REFERENCE: INV-1005-UT2 

; CURRENT APPLICATION NUMBER: US/11/371,354 

; CURRENT FILING DATE: 2006-03-07 

; PRIOR APPLICATION NUMBER: 60/673,045 

; PRIOR FILING DATE: 2005-04-19 

; PRIOR APPLICATION NUMBER: 60/665,199 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/665,200 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/659,493 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/659,492 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/953,586 

; PRIOR FILING DATE: 2005-02-15 

; PRIOR APPLICATION NUMBER: 60/651,390 

; PRIOR FILING DATE: 2005-02-08 

; NUMBER OF SEQ ID NOS : 78682 

; SOFTWARE: Patentln version 3.3 

; SEQ ID NO 63697 
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; LENGTH: 655 
; TYPE: PRT 

; ORGANISM: Homo sapiens 
US-11-371-354-63697 

Query Match 99.8%; Score 3346; DB 6; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 14 
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3-11-443-428A-811925 
Sequence 811925, Application US/11443428A 
Publication No. US20070083334A1 
GENERAL INFORMATION: 

APPLICANT: Mintz, Liat 

APPLICANT: Xie, Hanqing 

APPLICANT: Dahari, Dvir 

APPLICANT: Levanon, Erez 

APPLICANT: Freilich, Shiri 

APPLICANT: Beck, Nili 

APPLICANT: Zhu, Wei-Yong 

APPLICANT: Wasserman, Alon 

APPLICANT: Hermesh, Chen 

APPLICANT: Azar, Idit 

APPLICANT: Bernstein, Jeanne 

TITLE OF INVENTION: METHODS AND SYSTEMS USEFUL FOR ANNOTATING BIOMOLECULAR SEQUENCES 
FILE REFERENCE: 02/23929 

CURRENT APPLICATION NUMBER: US/ 1 1 / 4 43 , 42 8A 
CURRENT FILING DATE: 2006-05-31 
NUMBER OF SEQ ID NOS : 1034312 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 811925 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-1 1-4 43-42 8A-8 11 925 

Query Match 99.8%; Score 3346; DB 6; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 

Qy 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

Qy 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

Qy 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 240 

Qy 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 300 

Qy 301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 DSTAVALNREEDFKATEI I EPSKQDKPL I EKLAE I YVNSSFYKETKAELHQLSGGEKKKK 360 
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361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 I TVFKEISYTTSFCHQLRWVSKRSFKNLLGNPQAS I AQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



RESULT 15 

US-1 1-4 43-42 8A-8 11 926 

Sequence 811926, Application US/11443428A 
Publication No. US20070083334A1 
GENERAL INFORMATION: 

APPLICANT: Mintz, Liat 

APPLICANT: Xie, Hanqing 

APPLICANT: Dahari, Dvir 

APPLICANT: Levanon, Erez 

APPLICANT: Freilich, Shiri 

APPLICANT: Beck, Nili 

APPLICANT: Zhu, Wei-Yong 

APPLICANT: Wasserman, Alon 

APPLICANT: Hermesh, Chen 

APPLICANT: Azar, Idit 

APPLICANT: Bernstein, Jeanne 

TITLE OF INVENTION: METHODS AND SYSTEMS USEFUL FOR ANNOTATING BIOMOLECULAR SEQUENCES 
FILE REFERENCE: 02/23929 

CURRENT APPLICATION NUMBER: US/ 1 1 / 4 43 , 42 8A 
CURRENT FILING DATE: 2006-05-31 
NUMBER OF SEQ ID NOS : 1034312 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 811926 

LENGTH: 655 

TYPE: PRT 

ORGANISM: Homo sapiens 
S-l 1-4 43-42 8A-8 11 926 

Query Match 99.8%; Score 3346; DB 6; Length 655; 

Best Local Similarity 99.8%; Pred. No. 2.2e-287; 

Matches 654; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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SCORE Search Results Details for Application 09961086 and Search Result 20080917_142916_us-09-961-086a-l.rapbm. 

Db 1 MSSSNVEVFIPVSQGNTNGFPATASNDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVE 6 0 



61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 KEILSNINGIMKPGLNAILGPTGGGKSSLLDVLAARKDPSGLSGDVLINGAPRPANFKCN 120 

121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 SGYVVQDDVVMGTLTVRENLQFSAALRLATTMTNHEKNERINRVIQELGLDKVADSKVGT 180 

181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 QFIRGVSGGERKRTSIGMELITDPSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTI IF 2 40 

241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 S IHQPRYS IFKLFDSLTLLASGRLMFHGPAQEALGYFESAGYHCEAYNNPADFFLDI ING 3 00 

301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 DSTAVALNREEDFKATEI IEPSKQDKPLIEKLAEIYVNSSFYKETKAELHQLSGGEKKKK 360 

361 ITVFKEI SYTTSFCHQLRWVSKRSFKNLLGNPQASIAQI IVTVVLGLVIGAI YFGLKNDS 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 I TVFKEISYTTSFCHQLRWVSKRSFKNLLGNPQAS I AQI IVTVVLGLVIGAI YFGLKNDS 42 0 

421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TGIQNRAGVLFFLTTNQCFSSVSAVELFWEKKLFIHEYI SGYYRVSSYFLGKLLSDLLP 4 80 

481 MTMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 MRMLPSI IFTCIVYFMLGLKPKADAFFVMMFTLMMVAYSASSMALAIAAGQSVVSVATLL 5 40 

541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 MTICFVFMMIFSGLLVNLTTIASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGN 6 00 

601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NPCNYATCTGEEYLVKQGIDLSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 655 



Search completed: September 18, 2008, 22:15:05 
Job time : 257 sees 
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